iT邦幫忙

2021 iThome 鐵人賽

DAY 24
0

今日我們要來學習的重點是Elastic Uptime,Uptime主要是針對你的應用和服務進行監控,在問題影響到使用者前,先行發現並解決問題。

Uptime

Uptime 簡單的說就是判斷系統的是否還活著。現在的網路服務架構,會隨著時間的增加,而規模也會變得越來越複雜,因此 Elastic 推出了Elastic Uptime來對這些服務進行追蹤和監控,。

Elastic Uptime是使用 Heartbeat 來進行服務運行的監控,將服務運行的時間監控、日誌、指標與追蹤數據相結合,來實現各種監控的視覺化圖表。透過Heartbeat可以主動進行服務監控,讓我們能早點發現問題,並加快故障排除和問題原因分析,進而降低對客戶產生負面影響的風險。

在kibana介面中的提供可查看數據的儀表板,可以隨著時間去檢查服務器的狀態,並深入查看任何時間點數據資訊,而且還有支援警報器功能。

https://ithelp.ithome.com.tw/upload/images/20211001/20129762aLY6GRXkTP.png
圖片來源

Heartbeat 介紹

Heartbeat是一個輕量級的數據收集器,用來幫我們進行uptime的健康監控,能夠透過 HTTP、TCP和 ICMP等方式監控網絡端點的狀態,並將收集到的狀態和訊息回傳到Elasticsearch。

ICMP監控主機
ICMP通訊協定就是所謂的Ping,以此來判斷目標主機是否會正常回應。

HTTP監控網頁
測試Http呼叫web,並藉由Response來判斷Web是不是正常運作。

Socket監控網路服務
測試TCP或UDP是否有正常在接聽,以此判斷服務是否正常運作。

小結

一個可靠的監控功能,對維運人員可以說是一件友好的事情,否則你可能會為了系統是否能正常而進行監控,但這時又聽到如果監控也掛了要怎麼辨,這就是一個無解的議題,而且為了監控而監控這不是一個好的解決方式,所以我們就需要一個可信任且可靠的監控系統,來解決大部份監控的問題。

Reference


上一篇
Day23 設定Alerts
下一篇
Day25 安裝 Heartbeat
系列文
Elastic Stack(ELK)數據圖表化與異常監控30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言